Optimisation des requêtes temporelles sur le web
نویسندگان
چکیده
La recherche d’informations pertinentes sur le web est considérée comme un nouveau besoin de la société de l’information. Les méthodes de traitement d’informations fondées sur les statistiques ne sont plus suffisantes pour répondre aux besoins des utilisateurs afin de manipuler (rechercher, traduire, résumer...) les informations sur le web. Un constat tend à s’imposer : introduire plus de sémantique pour la recherche d’informations pertinentes issues des textes. En effet, lorsque l’utilisateur du web lance sa requête, il s’attend généralement à trouver précisément ce qu’il cherche, c’est à dire trouver « l’information pertinente », sans qu’il soit submergé par un volume de réponses non-maîtrisables et ingérables. Dans ce travail, nous présentons une approche permettant la recherche de documents sur le web prenant en compte des critères temporels. Notre approche est parente des projets en cours visant à améliorer les résultats des moteurs de recherche [Lawrence et al., 2001] [Glover et al., 2001]. Nous avons constaté que les requêtes recherchant un ou plusieurs événements ayant lieu à une date donnée ou pendant une période de temps bien déterminée, ne permettent pas d’obtenir les résultats attendus. Par exemple : Les découvertes scientifiques depuis 1940. Pour cette requête, l’utilisateur veut chercher les découvertes scientifiques depuis 1940 jusqu’à aujourd’hui et non pas pour l’année 1940, il s’agit de traiter un intervalle de temps. Notre étude consiste, d’une part, à reformuler des requêtes recherchant des documents textuels ayant un aspect événementiel [Faiz et Biskri, 2002] et ce en tenant compte du contexte de la requête [Desclés, 1993], et d’autre part, à obtenir des résultats pertinents répondant précisément à la requête lancée. Une requête de type « Evénement X + [date / intervalle de temps] » lancée par l’internaute sera analysée et segmentée en deux parties et ce par la détection d’un indicateur temporel (au mois de, pendant, depuis le, etc.). Le système proposé, permettra d’effectuer une recherche d’information événementielle avec un niveau de granularité plus fin et ce par le biais d’une transformation de la requête lancée.
منابع مشابه
HuTO: an Human Time Ontology for Semantic Web Applications
Un défi majeur en informatique est la modélisation et le raisonnement sur les données temporelles. Ce travail est devenu encore plus important avec l'émergence du Web sémantique où de grandes quantités données hétérogènes sont manipulées. Ces données comportent souvent des informations temporelles informelles, semi-formelles ou formelles qui doivent être interprétées par les agents logiciels. D...
متن کاملDes séquences aux tendances
RÉSUMÉ. Les données temporelles peuvent être traitées de nombreuses façons afin d’en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d’enregistrements annotés temporellement. L’analyse des accès à un site web permet par exemple de découvrir que “5% des utilisateurs accèdent à la page register.php puis à l...
متن کاملOptimisation de requêtes sur des données massives dans un environnement distribué. (Optimization of queries over large data in a distributed environment)
La matérialisation (ou pré-calcul de résultats) est une des techniques permettant d'optimiser les requêtes. Le problème qui se pose alors peut être décrit comme suit: étant donné un ensemble de requêtes cibles (workload), quelles sont les "meilleures" parties de la base de données qu'on doit matérialiser afin d'optimiser le workload ? La définition de "meilleure" peut prendre plusieurs dimensio...
متن کاملOrganisation de log de requêtes OLAP sous forme de site web
Résumé. Vu comme une simple collection de requêtes, un log de requêtes d’un serveur OLAP est une structure peu exploitable. Dans cet article, nous proposons d’organiser un log de requêtes d’un serveur OLAP sous la forme d’un site web. Cela a plusieurs avantages, comme la compréhension rapide de ce qui a été fait lors des sessions d’analyse précédentes ou comme l’aide aux futures sessions d’anal...
متن کاملDémarches sémantiques de recherche d'information sur le Web
Résumé : L’examen de différents projets de recherche visant à supporter les activités des membres d’une communauté à l’aide d’une mémoire collective met en évidence l’intérêt de capitaliser les requêtes formulées à la mémoire et plus généralement les savoir-faire experts d’une communauté en matière de recherche d’information. L’enjeu est de donner les moyens aux membres d’une communauté de réut...
متن کامل